Test du chi-deux
Test permettant de comparer une distribution de caractères dans un échantillon avec une
Loi théorique, en prenant comme
Hypothèse nulle \(H_0\) le fait qu'elles soient conformes.
- procédure :
- Calculer effectifs théoriques pour chaque caractère via \(C_i=np_i\)
Répertorier les effectifs \(O_i\) observés pour chaque caractère dans l'échantillon
Calculer la valeur : $$D^2:=\sum^k_{i=1}\underbrace{\frac{(O_i-C_i)^2}{C_i} }_{\underset{H_0}\sim\mathcal N(0,1)}$$
Si \(\forall i,C_i\geqslant5\), \(k\lt 20\) et \(n\gt 50\), alors on peut approcher la loi de \(D^2\) via \(D^2\sim\chi^2(\gamma)\)
- comment choisir \(\gamma\) ? C'est le nombre de variables indépendantes qui la composent
- pourquoi prendre \(k-1\) ? Connaissance de tous les effectifs sauf 1 et de l'effectif total donne le dernier effectif
- Dans la table de Pearson (du \(\chi^2\)), pour \(\gamma\) donné, lire la valeur de \(\chi_\alpha^2\) tq \({\Bbb P}(Y^2\geqslant\chi_\alpha^2)=\alpha\)
On peut conclure en réfutant \(H_0\) si \(D^2\geqslant\chi_\alpha^2\) (avec probabilité \(\alpha\) de se tromper)
- permet également de faire un test d'homogénéité, (checker si \(t\) échantillons viennent d'une même population) en regroupant ces \(t\) populations en une seule et en prenant $$C_{ij}=\frac{T_j\times S_i}{N}$$
- il faut prendre \(\gamma=\) \((k-1)(t-1)\)
- permet également de faire un test d'indépendance, en prenant $$C_{ij}=\frac{S_{A_i}\times S_{B_j} }{N}$$
- il faut prendre \(\gamma=\) \((t-1)(k-1)\)